home *** CD-ROM | disk | FTP | other *** search
/ Celestin Apprentice 5 / Apprentice-Release5.iso / Source Code / Libraries / DCLAP 6d / dclap6d / Docs / SeqPup.Help < prev    next >
Text File  |  1996-07-05  |  22KB  |  612 lines

  1. SeqPup Help
  2.                             -  -
  3. @Abstract
  4.  
  5. SeqPup is a biological sequence editor and analysis program
  6. for Macintosh computers.  It includes links to network
  7. services and  external analysis programs.
  8.  
  9. Features include
  10.      multiple sequence alignment editor
  11.      single sequence editor window
  12.      read and write several sequence file formats
  13.      consensus,reverse,complement,degap operations
  14.      automatic preference saving
  15.      internet send mail
  16.      internet sequence analysis services
  17.      and more
  18.  
  19.  
  20. NOTICE:  This is an early, unfinished version of the
  21. program.   Expect it to fail in various ways.  This release
  22. is made available to those who wish to test and comment on
  23. its future development. This release will expire on a date
  24. indicated in the About dialog.
  25.  
  26. SeqPup is being written by Don Gilbert using DCLAP, a C++
  27. Class Application framework, and founded on the NCBI
  28. Toolkit, especially it's Vibrant user-interface section
  29. written by Jonathan Kans.   DCLAP is based loosely on the
  30. MacApp extensible programming framework from Apple Computer.
  31.  
  32. You can obtain updates of this release thru anonymous ftp to
  33. ftp.bio.indiana.edu, in folder /molbio/seqpup, as seqpup.hqx
  34. (Macintosh), seqpup.zip (MS Windows), seqpup-sun-sparc.tar.Z
  35. (SunOS Sparcstation), and perhaps other binaries. There may
  36. be additional distribution software, data or information in
  37. this /molbio/seqpup folder.  See the Readme files in it for
  38. details.
  39.  
  40. The file SeqPup.Help is a plain text file which may be read
  41. from your favorite wordprocessor or from the Edit program in
  42. the Apps folder.  If you have problems getting SeqPup to
  43. launch, and cannot  read this help from SeqPup, please read
  44. it with another application  to help solve the problem.
  45.  
  46. Comments, bug reports and suggestions for new features (see
  47. below) may be addressed via e-mail to
  48.  
  49.           SeqPup@Bio.Indiana.Edu
  50.  
  51. History
  52.  
  53. SeqPup was started Sept. 1990 as MacApp sequence
  54. editor/analysis platform  on which analysis programs from
  55. other authors, typically command line  w/ weak user
  56. interfaces, could be easily incorporated into a useable Mac
  57. interface.
  58.  
  59.  
  60. @SeqPup Help
  61.  
  62. SeqPup provides a biological sequence editor and related
  63. functions, including links to network services and external
  64. analysis programs.
  65.  
  66.   *******************************************
  67.   ****                    NOTICE
  68.   ****
  69.   ****  This is an early, unfinished version of the
  70.   ****  program.  Expect it to fail in various ways.
  71.   ****  This release made available to those who wish
  72.   ****  to test and comment on its future development.
  73.   ****
  74.   *******************************************
  75.  
  76. This program is a long-term research/development project.
  77. It has already gone thru several changes since its start in
  78. September 1990.  Don't expect it to be "complete" for a
  79. while (years) yet.  It is publicly available now as it has
  80. been useful to some as is.
  81.  
  82. Comments, bug reports and suggestions for new features (see
  83. below) may be addressed via e-mail to
  84.           SeqPup@Bio.Indiana.Edu
  85.  
  86. With any bug reports, I would appreciate as much detail as
  87. is reasonable without putting you off from making the
  88. report.  Include description of computer hardware, system
  89. software version.  Include copies of data if relevant.
  90.  
  91. If you need to use land mail, send to
  92.  
  93.                Don Gilbert
  94.                Biocomputing Office, Biology Department
  95.                Indiana University, Bloomington, IN 47405
  96.  
  97. This SeqPup program is copyrighted 1992 by D.G. Gilbert.  It
  98. is written using DCLAP, a C++ Class Application framework,
  99. also developed by D.Gilbert.  This framework is founded on
  100. the NCBI Toolkit, especially it's Vibrant user-interface
  101. section written by Jonathan Kans.   DCLAP is based loosely
  102. on the MacApp extensible programming framework from Apple
  103. Computer.
  104.  
  105. Any external applications that may distributed with SeqPup
  106. are copyrighted by their respective authors and subject to
  107. distribution provisions as described by those authors.
  108.  
  109.  
  110. @Installing
  111.  
  112. [--- obsolete --- needs rewriting for SeqPup --- ]
  113.  
  114.  
  115. @Views
  116.  
  117. There are now four main types of views or displays in
  118. SeqPup:
  119.  
  120. A multiple-sequence view which is the primary display when
  121. you open a sequence document; the single sequence editting
  122. view; various print views which result from an analysis,
  123. like the Restriction map; and dialog views where you control
  124. some function.
  125.  
  126. Many of these views have dialog controls -- push buttons,
  127. check boxes, radio controls and edittable text items -- to
  128. let you fine-tune a view to fit your preference.  Many of
  129. these views also will remember your last preferences.
  130.  
  131. When a view has edittable text items, including the sequence
  132. entry views, most usual Mac undo/cut/copy/paste features
  133. will work, as will font, size and style controls.
  134.  
  135. Two or more views of the same data are possible.  Some of
  136. these are truly views of the same data -- changes made in
  137. one view are reflected in another. Other views are static
  138. pictures taken of the data at the time the  analysis was
  139. performed -- later changes to the data do not affect that
  140. picture.
  141.  
  142. @@Aligned multi-sequence view
  143.  
  144. The main view into a sequence document is the multiple
  145. sequence editor window, which lists sequence names to the
  146. left and sequence bases as one line that can be scrolled
  147. thru.  Bases can be colored (now only nucleic colorings) or
  148. black.  Sequence can be editted here, especially to align
  149. them, and subranges and subgroupings can be selected for
  150. further operations or analysis. Entire sequence(s) can be
  151. cut/copied/pasted by selecting the left name(s).  Mouse-down
  152. selects one. Shift-mouse down selects many in group, Command-
  153. mouse down selects many unconnected. Double click name to
  154. open single sequence view.  Select name, then grab and move
  155. up or down to relocate.
  156.  
  157. Select the lock/unlock button at the view top to lock/unlock
  158. text editting in the sequence line.  With lock on (no
  159. editting) you can use shift and command mouse to select a
  160. subrange of sequences to operate on.
  161.  
  162. Bases can be slid to left and right, like beads on an
  163. abacus, when the edit lock is On (now default).  Select a
  164. base or group of bases (over one or several sequences),
  165. using mouse, shift+mouse, option+mouse, command+mouse.  Then
  166. grab selected bases with mouse (mouse up, then mouse down on
  167. selection), and slide to left or right.  Indels "-" or
  168. spacing on ends "." will be added and squeezed out as needed
  169. to slide the bases.  See also the "Degap" menu selection to
  170. remove all gaps thus entered from a sequence.
  171.  
  172. @@Single sequence view
  173.  
  174. For entering/editting a single sequence, this view displays
  175. one sequence with more info and control.  Edit the name here
  176. (later other documentation). Bring out this view by double-
  177. clicking sequence name in align view, or choosing Edit from
  178. Sequence menu.
  179.  
  180. @@Print views
  181.  
  182. Various analyses provide non-editable displays.  These are
  183. usually save-able as PICT format for editting in your
  184. favorite MacDraw program, or print-able.
  185.  
  186. @Data files
  187.  
  188. SeqPup uses plain TEXT type files for its primary sequence
  189. data.  These  files can be exchanged without modification
  190. with many other sequence analysis programs.  SeqPup
  191. automatically determines the sequence format of a data file
  192. when openning it.  You have an choice of several formats to
  193. save it as.  As of this writing, the GenBank format is
  194. prefered (see bugs).
  195.  
  196.  
  197. There is a "seqpup.cnf" (mac) / "seqpup.ini" (mswin) /
  198. ".seqpuprc" (unix) file which stores various user options
  199. like window positions, mail address, child tasks.  Also look
  200. for "dclap..." prefs file.  This automatically generated by
  201. SeqPup.  It goes in a System Folder:Preferences: folder
  202. (mac) .
  203.  
  204.  
  205.  
  206.  
  207. @Features
  208.  
  209. The following topics describe main features found in the
  210. SeqPup menus.
  211.  
  212. @@File
  213.  
  214. New will create an align view of sequence data.  New Text
  215. will create a plain text document, which is the format of
  216. the sequence data files also.
  217.  
  218. Open will open an exising file.   The default choice will
  219. open a file of sequences into a new window.   You can choose
  220. "Sequence, append", or hold down the SHIFT key, to open a
  221. sequence file and append it to an existing alignment window.
  222.  
  223. Other Open options include opening a plain text file, a file
  224. of phylogeny trees in Newick format (see  Phylip
  225. documentation), or a Gopher document.
  226.  
  227. Save, Save as, Save a copy in, all will save the current
  228. document to disk files. Revert will restore the open align
  229. view to the last version saved to disk.
  230.  
  231. Save selection, Saves only highlighted sequences to a new
  232. disk file.  Doesn't affect save status of current full
  233. alignment document.
  234.  
  235. Print setup, print will print the current view.
  236.  
  237. Help brings up a view to page thru the help file.
  238.  
  239. Preferences will set some user preferences.
  240.  
  241. @@Editing
  242.  
  243. Undo, cut, copy, paste, clear, select all -- these standard
  244. mac commands will operate on text as well as on sequences in
  245. (hopefully) intuitive, usual ways.
  246.  
  247. Find, Find same, Find "selection" will search for strings in
  248. text.
  249.  
  250. Replace, replace same will replace target strings (not yet
  251. enabled).
  252.  
  253.  
  254. @@Sequence manipulations
  255.  
  256. New sequence -- append a new, blank sequence to the sequence
  257. document.
  258.  
  259. Edit -- open single sequence editting view for selected
  260. items.
  261.  
  262. Reverse, Complement, Rev-complement -- Reverse, complement
  263. or reverse+complement a sequence. Works on one or more
  264. sequences, and the selected subrange.
  265.  
  266. Rna-Dna,Dna-Rna -- Convert dna to rna (t->u) and vice versa.
  267. Works on one or more sequences, and the selected subrange.
  268.  
  269. Degap -- remove alignment gaps "~".   Works on one or more
  270. sequences, and the selected subrange. Gaps of "-" are locked
  271. and not affected by Degap.   Works on one or more sequences,
  272. and the selected subrange.
  273.  
  274. Lock Indel & Unlock Indel -- Convert from unlocked gaps "~",
  275. to locked gaps "-".  Unlocked gaps will disappear and appear
  276. as needed as you slide bases left and right.  Locked gaps
  277. are not affected by sliding nor by Degap.   Works on one or
  278. more sequences, and the selected subrange.
  279.  
  280. Consensus -- generate a consensus sequence of the selected
  281. sequences.
  282.  
  283. Translate -- translate to/from amino acid.  Relies on
  284. Codon.Table data.
  285.  
  286. Pretty print -- a prettier view of a single or aligned
  287. sequences.  Use these views to print your sequences.
  288. Printing from the editing display will not be supported
  289. fully, and may not print all of your sequence(s).
  290.  
  291. Restriction map -- Restriction enzyme cut points of selected
  292. sequence.  Also protein translation options.
  293.  
  294. Dotty plot -- provide a dot plot comparison of two
  295. sequences.
  296.  
  297. Nucleic, amino codes -- These provide both reminders of the
  298. base codes, and a way to select colors to assocate with each
  299. code (new in v 1.9a).  See below for some discussion of the
  300. two "aa-color" documents that now ship with SeqPup.
  301.  
  302. @@Internet
  303.  
  304. The Internet features of SeqPup let you interchange ideas
  305. and data with people and biocomputing services around the
  306. world.  If your Mac is connected already to the Internet,
  307. you probably are familiar with electronic mail and some of
  308. its uses.
  309.  
  310. SeqPup includes a selection of network access features in
  311. the developing area of networked biocomputing.  You will
  312. find access to me, at least to get comments and bug reports
  313. to me, very easy.  There is a feature to send and receive e-
  314. mail, as well as mail links to customized e-mail services.
  315. These include searching for sequence similarity via BLAST
  316. and FastA programs on the Genbank/Intelligenetics computers,
  317. fetching sequences, data and software from Genbank and EMBL.
  318.  
  319. There is now an feature called Gopher, which gives you
  320. access to a wide range of information services now
  321. developing on the Internet.  Gopher is something like Telnet
  322. or FTP (file transfer), but also different.  It includes
  323. some of the keyword searching features of WAIS (Wide Area
  324. Information Services). There are currently several biology
  325. gopher services found around the globe. These include fast
  326. and up-to-date keyword searches of GenBank, EMBL, PIR and
  327. other important biology databanks.
  328.  
  329.  
  330.  
  331. @@@Mail Preferences
  332.  
  333. The mail prefs dialog asks for your return e-mail address,
  334. your preferred SMTP mail host, and your POP mail address and
  335. password.  These addresses may be similar.
  336.  
  337. Return e-mail address:  This is where another person should
  338. send mail so it will reach you.
  339.           Example:  Bob.Jones@University.Edu
  340.                   or:  bjones@MainComputer.University.Edu
  341.  
  342. SMTP Mail host:  This is the internet address of the
  343. computer thru which  SeqPup will send out mail to the rest
  344. of the world.
  345.           Example:  MainComputer.University.Edu
  346.  
  347.  
  348. @@@Send Mail
  349.  
  350. Send an electronic mail message.  You must enter an address
  351. to send to, and have entered your return address in the mail
  352. preferences dialog.
  353.  
  354.  
  355. @Mail-based Search and Fetch
  356.  
  357. Various network resources provide biocomputing services thru
  358. e-mail.  These include retreiving sequence entries from the
  359. various databanks (GenBank, EMBL, PIR), fetching help
  360. documents, and searching for sequences in the databanks that
  361. match your query sequences.
  362.  
  363.  
  364.  
  365.  
  366. @Bugs
  367.  
  368. SeqPup version -1 has plenty of bugs and missing features,
  369. including:
  370.  
  371.      no Undo (this is a real bite to those used to it)
  372.      mostly no cut/copy/paste/clear
  373.      limited printing of documents or views
  374.      mostly no align-view manipulations (move,cut/copy,edit
  375. in place, shift, ...)
  376.      no pretty print views
  377.      no restriction maps
  378.      no dot plots
  379.      no ...
  380.      problems w/ window display & keeping track of active
  381. window (x,mswin)
  382.  
  383. I'll be adding back many of these features from the
  384. Macintosh SeqApp as time permits.
  385.  
  386.  
  387. SeqApp version 1.9a involved major amounts of rewriting of
  388. the underlying program code, without as many improvements as
  389. I would have liked.   This major rewrite was prompted by the
  390. move from Apple's extensible macintosh application
  391. framework, MacApp version 2 to version 3.  The move was
  392. needed because MacApp 2 is essentially obsolete.  New
  393. general application features are found in MacApp version 3,
  394. a few of which you may notice.  Also, this is preliminary to
  395. translating the code from the Object Pascal language into
  396. the C++ language.  The future of MacApp is to move to a
  397. computer-make independent application framework called
  398. Bedrock, which may be available in 1994 for Mac, Windows,
  399. and possibly Unix systems.  It is my hope to move SeqPup
  400. onto this, but I make no promises or predictions at this
  401. time.
  402.  
  403. There are still several known bugs, and probably some
  404. unknown bugs lurking in this release.   A prime rule in
  405. using this software is to be aware of its incomplete nature,
  406. and save early and often.
  407.  
  408. Please also send in detailed descriptions of bugs you find.
  409. If the bug seems to be erratic, as many are, try to find
  410. some circumstances which will cause it to appear repeatable
  411. and explain these to me.   Your reports will help improve
  412. this program for you and others.  E-mail bug reports to
  413.      SeqPup@Bio.Indiana.Edu
  414.  
  415.  
  416.  
  417. @Future Features
  418.  
  419.  
  420. The future of MacApp on which SeqApp is based, is to move to
  421. a platform independent application framework called Bedrock,
  422. which may be available in 1994 for Mac, Windows, and
  423. possibly Unix systems.  It is my hope to move SeqPup onto
  424. this, but I make no promises or predictions at this time.
  425.  
  426. [Winter 1994:  The future is here -- BedRock is dead, but
  427. DClap is here instead to provide a platform independent
  428. framework.]
  429.  
  430. Here is a list of things which may be added to SeqPup in the
  431. future, depending on your interest.
  432.  
  433. Sequence documentation handling.  Currently no provisions
  434. for documentation per sequence.  This will at least change
  435. to a window for any comments and saving it into files (where
  436. file format permits).  Possibly I will put effort into
  437. dealing with the features, references, etc., in a fashion
  438. along lines of Genbank/EMBL documentation structure &/or
  439. Authorin documentation. Your comments on the importance of
  440. this are desired.
  441.  
  442. Feature table parsing -- pull out subsequences from Gen/EMBL
  443. feature info.
  444.  
  445. Align, single sequence pretty print -- header, page
  446. numbering user prefs should be added.
  447.  
  448. Restriction map -- Could use some speed-up.  Some would like
  449. graphic map (i.e., one line or circle w/ cut points per
  450. zyme).
  451.  
  452. NCBI ASN.1 file format. -- this will be available soon after
  453. the 1.9a 157 release, as the newest Readseq code which
  454. reads/writes ASN.1, is fully rolled into SeqPup.
  455.  
  456. Open reading frame mapping, other single sequence analyses (
  457. what?)
  458.  
  459. Simple protein analysis routines, better protein handling
  460. (colors are now nuc specific).  -- colors are user
  461. selectable now in 1.9a.   I expect to put most/all of the
  462. features of DNA Strider into SeqPup -- let me know your
  463. favorite ones.
  464.  
  465. Links to child tasks:  these depend as much on agreement of
  466. the authors of various routines as on user interest.  Among
  467. routines that I already have a handle on -- MulFold (Zuker),
  468. Phylip phylogeny analysis (Felsenstein), tree draw program
  469. (Felsenstein + my hacks a la Tree Draw desk).
  470.  
  471. Links to NETWORKED child tasks (e.g., on fast compute
  472. servers).   Perhaps thru Gopher, or otherwise.
  473.  
  474.  
  475. @History
  476.  
  477. SeqPup/SeqApp was started Sept. 1990 as MacApp sequence
  478. editor/analysis platform  on which analysis programs from
  479. other authors, typically command line with weak user
  480. interfaces, could be easily incorporated into a useable Mac
  481. interface.
  482.  
  483. SeqPup, March 1994, version -1.  First public release of
  484. SeqPup, the platform-independent version derived from the
  485. earlier Macintosh SeqApp.  SeqPup will eventually include
  486. most or all of SeqApp's features, and new features will be
  487. added.
  488.  
  489. SeqApp, 20 June 93, version 1.9a162 -- a minor update, with
  490. these bug fixes since last release:
  491.   -- fixed base number index in align view to correctly
  492. index the bases.  Also fixed base number index scrolling
  493. link to sequence scrolling.
  494.   -- fixed paste of align sequence into blank window to
  495. correctly update full width of display.
  496.  
  497. 12+ June 93, version 1.9a157+ -- a semi-major update, and
  498. time extension release with various enhancements and
  499. corrections.  These include
  500.   -- lock/unlock indels (alignment gaps). Useful when
  501. sliding bases around
  502.   during hand alignment, to keep alignment fixed in some
  503. sections.
  504.   -- color amino (and nucleic) acids of your choice.
  505.   -- added support for more sequence file formats: MSF,
  506. PAUP, PIR.  SeqApp now relies on the current Readseq code
  507. for sequence reading & writing.
  508.   -- save selection option to save subset of bases to file.
  509.   -- addition the useful contig assembly program CAP,
  510. written by Xiaoqiu Huang.
  511.   -- major revision of preference saving method (less buggy,
  512. I hope)
  513.   -- major revision of the underlying application framework,
  514. due to moving from MacApp 2 to MacApp 3.
  515.   -- fixed a bug that caused loss of data when alignment
  516. with a selection was saved to disk.
  517.  
  518. 5 Oct 92, version 1.8a152+ -- a semi-major update with
  519. various enhancements and corrections.  These include
  520. - corrections to the main alignment display,
  521. - improvements to the help system,
  522. - major changes to the sequence print-out options,
  523. -- including addition of a dotplot display (curtesy of
  524. DottyPlot),
  525. -- a phylogeny tree display (curtesy of TreeDraw Deck & J.
  526. Felsenstein's DrawTree),
  527. -- improved Pretty Print, which now has a single sequence
  528. form and a better aligned sequence form,
  529. -- improved Restriction map display,
  530. - addition and updating of several e-mail service links,
  531. -- including Blast Search and Genbank Fetch via NCBI,
  532. -- BLOCKS, Genmark, and Pythia services,
  533. - updated Internet gopher client (equal to GopherApp),
  534. - editable Child Tasks dialogs
  535. - addition of links to Phylip applications as Child Tasks
  536. - addition of Phylip interleaved format as sequence output
  537. option
  538.  
  539. 11 June 92, version 1.6a35 is primarily a bug fix release.
  540. Several of the  disasterous bugs have been squashed. This
  541. version now works on the Mac SE model, except for sendmail.
  542. No new features have been added.
  543.  
  544. 7Jun92, v. 1.5a?? -- fixed several of the causes of
  545. mysterious bombs  (mostly uninitialized handles), link b/n
  546. multiseq and 1-seq views is better now, folded in GopherApp
  547. updates, death date moved to Jan 93,
  548.  
  549. 25Mar92, v1.5a32 (or later).  First release to general
  550. public.  Includes Internet Gopher client.  Also released
  551. subset as GopherApp for non-biologists.
  552.  
  553. 4Mar92, v 1.4a38 -- added base sliding in align view. Bases
  554. now slide something like beads on an abucus.  Select a
  555. section with mouse, then grab section and shift left or
  556. right. Gaps are inserted/removed as needed. For use as
  557. contig aligner, still needs equivalent of GCG GelOverlap to
  558. automatically find contig/fragment overlaps.
  559.  
  560. Also added "Degap" menu item, to remove "." and "-".  Fixed
  561. several small bugs including Align pretty print which again
  562. should display.
  563.  
  564. 2Mar92, v 1.4a19 -- fixed several annoying bugs, see
  565. SeqApp.Help, section on bugs for their resolution.  These
  566. include Complement/Reverse/Dna2Rna/ Translation which should
  567. work now in align view; Consensus menu item; entering
  568. sequence in align window now doesn't freeze after 30+ bases;
  569. pearson/fasta format reading; ...
  570.  
  571. 10Feb92, v 1.4a6 -- fix for Mac System 6; add Internet
  572. service dialogs for Univ. Houston gene-server, Geneid @ BU,
  573. Grail @ ORNL; correct About Clustalv attribution.
  574.  
  575. 5Feb92, v 1.4a4 -- limited release to network resource
  576. managers, clustalv authors, testers.
  577.  
  578. Vers 1.4, Dec91 - Feb92. Dropped multi-sequence picker
  579. window, made multi-align window  the primary view (no need
  580. for both; extra confusion for users).  added pretty print,
  581. restriction map, sequence conversions.   Generalized "call
  582. clustal" to Hypercard-like, System 7 aware menu  for calling
  583. external tasks. Fleshed out internet e-mail objects, added
  584. help objects, window menu, nucleic/amino help windows. Many
  585. major/minor revisions to all aspects to clean out bugs.
  586. Preliminary release to a limited set of testers (1.4a?)
  587.  
  588. Vers. 1.3, Sept - Dec91. Modified clustalv for use as
  589. external app (commandline file, background task, ...). Added
  590. basic Internet e-mail routines call clustal routine
  591. (preliminary child task)  Many major/minor revisions to all
  592. aspects to clean out bugs.
  593.  
  594. Jun91-Aug91:  overwork at other tasks kept SeqApp on back
  595. burner.
  596.  
  597. Mar91-Jun91: not much work on SeqApp, fleshed out TCP
  598. methods (UTCP, USMTP, UPOP).
  599.  
  600. Feb 1991, vers 1.2? made available to Indiana University
  601. biologists and NCBI biocomputists.
  602.  
  603. Vers. 1.1, Oct 1990, multiple sequence picker and multiple
  604. sequence alignement window, including colored bases, added
  605. to deal with alignment and common multi-sequence file
  606. formats.
  607.  
  608. Version 1, Sep 1990. Single sequence edit window + TextEdit
  609. window,  from MacApp skeleton/example source + readseq.
  610.  
  611.  
  612.